ارتقای کیفیت دسته بندی متون با استفاده از کمیته دسته بند دو سطحی
نویسندگان
چکیده
امروزه با توجه به رشد روز افزون دسترسی به اسناد الکترونیکی، دسته بندی خودکار اهمیت ویژه ای یافته است. روش های معمول در این زمینه، روش های یادگیری ماشین هستند. روش های بر اساس کمیته کارایی بهتری نسبت به سایر روش ها از خود نشان داده اند. در این مقاله، دو ایده در زمینه کمیته های دسته بند ارائه شده است. ایده اول برمبنای کمیته bagging که در آن هرکدام از اعضای کمیته روی زیرمجموعه ای از مجموعه سندهای آموزشی، ساخته می شوند، ارائه شده است. بر اساس این ایده، ابتدا مجموعه آموزش با یک روش خوشه بندی به چند خوشه، بر اساس مشابهت یا عدم مشابهت کلاس های اسناد آموزشی، تقسیم می شود و سپس از روی هر خوشه از اسناد، یک دسته بند ساخته شده و به عنوان عضو کمیته قرار داده می شود (روش یادگیری اعضای کمیته یکسان است). در ایده دوم ساخت کمیته ای دو سطحی مطرح شده است. در این ایده اعضای کمیته های سطح دوم خود کمیته هایی هستند که بر مبنای ایده اول ساخته می شوند. در ارزیابی ایده اول مشخص شد که افزایش کارایی بر مبنای معیار دقت و معیار بازخوانی در کمیته بیزین ساده نوع اول، بیشتر از سایر کمیته های نوع اول بوده و به ترتیب 12 درصد و 1/5 درصد می باشد. ارزیابی ها در کمیته نوع دوم (برمبنای ایده دوم)، افزایش کارایی را نسبت به کمیته نوع اول نشان می دهند که بیشترین آن نسبت به کمیته rocchio نوع اول بوده، که معیار دقت را در حدود 8/3 درصد و معیار بازخوانی را در حدود 8/18 درصد افزایش داده است.
منابع مشابه
ارائه ی یک مدل جهت دستهبندی متون فارسی با استفاده از ترکیب روش های دسته بندی
برای دستهبندی متن از تکنیکهای استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده میشود به طور کلی هدف یک دسته بند متون، دستهبندی اسناد در قالب تعداد معینی از دستههای از پیش تعیین شده میباشد. هر سند میتواند در یک، چند و یا هیچ دستهای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دستهها قرار میگیرد. این موضوع میتواند در قالب یک ی...
متن کاملارائه ی یک مدل جهت دستهبندی متون فارسی با استفاده از ترکیب روش های دسته بندی
برای دستهبندی متن از تکنیکهای استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می شود به طور کلی هدف یک دسته بند متون، دستهبندی اسناد در قالب تعداد معینی از دستههای از پیش تعیین شده میباشد. هر سند می تواند در یک، چند و یا هیچ دسته ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دستهها قرار می گیرد. این موضوع می تواند در قالب یک ی...
متن کاملارتقای کیفیت دستهبندی متون با استفاده از کمیته دستهبند دو سطحی
امروزه با توجه به رشد روز افزون دسترسی به اسناد الکترونیکی، دستهبندی خودکار اهمیت ویژهای یافته است. روشهای معمول در این زمینه، روشهای یادگیری ماشین هستند. روشهای بر اساس کمیته کارایی بهتری نسبت به سایر روشها از خود نشان دادهاند. در این مقاله، دو ایده در زمینه کمیتههای دستهبند ارائه شده است. ایده اول برمبنای کمیته bagging که در آن هرکدام از اعضای کمیته روی زیرمجموعهای از مجموعه سنده...
متن کاملدسته بندی پرسش ها با استفاده از ترکیب دسته بندها
هدف از تولید و گسترش سیستم های پرسش و پاسخ، ایجاد پاسخ دقیق برای پرسش داده شده به زبان طبیعی می باشد. یکی ازمهم ترین بخش های سیستم های پرسش و پاسخ دسته بندی پرسش است. عمل دسته بندی پرسش، پیش بینی نوع پاسخ مورد نیاز برای پرسش داده شده به زبان طبیعی می باشد. کارهای انجام شده در این زمینه را می توان در دو دسته ی مبتنی بر قانون و مبتنی بر یادگیری تقسیم کرد. در این مقاله برای دسته بندی پرسش ها، از ی...
متن کاملارتقای کیفیت دستهبندی متون با استفاده از کمیته دستهبند دو سطحی
Nowadays, the automated text classification has witnessed special importance due to the increasing availability of documents in digital form and ensuing need to organize them. Although this problem is in the Information Retrieval (IR) field, the dominant approach is based on machine learning techniques. Approaches based on classifier committees have shown a better performance than the others. I...
متن کاملارائه روشی کارا برای دسته بندی مسائل چنددسته ای با رویکرد انتخاب دسته بند
سیستمهای دسته بندی شورایی، رویکردی مؤثر در یادگیری ماشین است که در آن با ترکیب نتایج چند دسته بند سعی می شود تقریب بهتری از یک دسته بند بهینه فراهم شود. در حوزه ترکیب خروجی شورای دستهبندها، رویکرد «انتخاب دستهبند» توجه کمتری را در مقایسه با رویکرد «ادغام دسته بند» به خود جلب کرده است. همچنین، اغلب روشهای موجود در این حوزه، هزینه محاسباتی بالایی دارند. در این مقاله، روشی مؤثر در دسته بندی مسائل ...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
نشریه دانشکده فنیناشر: دانشکده فنی
ISSN 0803-1026
دوره 41
شماره 7 2007
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023